Construction automatique de ressources lexicales pour la fouille d'opinion

نویسنده

Yves Bestgen

چکیده

RÉSUMÉ. De nombreuses méthodes automatiques de fouille d'opinion s'appuient sur un lexique dans lequel à chaque entrée est associé un degré de polarité. La construction de telles ressources linguistiques est donc devenue un champ de recherche important en linguistique computationnelle. Des techniques automatiques, basées sur les similarités sémantiques entre les mots dont on veut estimer la polarité et des mots dont la polarité est connue, ont été développées ces dix dernières années et leur efficacité a été confirmée. La présente recherche propose d'étendre de telles procédures à l'analyse de n-grammes de mots et de déterminer les éventuels bénéfices apportés par cette extension. Une expérience menée sur la base d'un vaste corpus de critiques de films indique non seulement que les n-grammes semblent être des indicateurs plus fiables de polarité que les mots simples, mais aussi que leur combinaison avec ces mêmes mots simples permet une meilleure prédiction de la polarité de textes. Soulignant le caractère exploratoire et les limitations de la présente étude, la conclusion propose quelques pistes pour des recherches futures.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Comparabilité de corpus et fouille terminologique multilingue

RÉSUMÉ. Les principaux travaux en fouille textuelle privilégient communément la taille du corpus sur sa qualité. Ainsi dans le cadre de l’alignement lexical à partir de corpus comparables, les meilleurs résultats sont obtenus pour des corpus de grande taille (plusieurs millions de mots). Pour les domaines de spécialité, et pour de nombreuses paires de langues, il n’est pas possible de disposer ...

متن کامل

Khiops: outil d'apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables

Résumé. Khiops est un outil d’apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables. L’importance prédictive des variables est évaluée au moyen de modèles de discrétisation dans le cas numérique et de groupement de valeurs dans le cas catégoriel. Dans le cas d’une base multi-tables, par exemple des clients avec leurs achats, une table d’analyse individus ×...

متن کامل

Vers une méthode automatique de construction de hiérarchies contextuelles

Résumé. Dans de nombreux domaines (e.g., fouille de données, entrepôts de données), l’existence de hiérarchies sur certains attributs peut être extrêmement utile dans le processus analytique. Toutefois, cette connaissance n’est pas toujours disponible ou adaptée. Il est alors nécessaire de disposer d’un processus de découverte automatique pour palier ce problème. Dans cet article, nous combinon...

متن کامل

Utilisation de la Fouille de Données Images pour l'Indexation Automatique des Images

Cet article introduit un nouveau challenge pour la fouille de données qui consiste en la découverte de connaissances dans des collections d’images, appelé également Fouille de Données Images (Image Mining (IM)). Dans le but d’une indexation sémantique des images, nous nous focalisons sur le problème de la découverte de connaissances à partir du contenu des images d’un enesemble d’apprentissage,...

متن کامل

Indexation et intégration de ressources textuelles à l'aide d'ontologies : application au domaine biomédical

Résumé : De nombreuses découvertes scientifiques sont contraintes aujourd’hui par la difficile intégration des données misent à disposition dans différentes ressources. L’utilisation d’ontologies pour indexer et intégrer les ressources de données est un moyen de valoriser la connaissance d’un domaine en facilitant la recherche et la fouille de données. Dans cet article nous présentons un mécani...

متن کامل

ذخیره در منابع من

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره شماره

صفحات -

تاریخ انتشار 2013

Construction automatique de ressources lexicales pour la fouille d'opinion

نویسنده

چکیده

منابع مشابه

Comparabilité de corpus et fouille terminologique multilingue

Khiops: outil d'apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables

Vers une méthode automatique de construction de hiérarchies contextuelles

Utilisation de la Fouille de Données Images pour l'Indexation Automatique des Images

Indexation et intégration de ressources textuelles à l'aide d'ontologies : application au domaine biomédical

عنوان ژورنال:

اشتراک گذاری